Mạng nơ ron nhân tạo là gì? Các công bố khoa học về Mạng nơ ron nhân tạo
Mạng nơ ron nhân tạo (Artificial Neural Network, ANN) là một thuật toán tính toán dựa trên cấu trúc và hoạt động của hệ thống nơ ron trong não bộ con người. Mạn...
Mạng nơ ron nhân tạo (Artificial Neural Network, ANN) là một thuật toán tính toán dựa trên cấu trúc và hoạt động của hệ thống nơ ron trong não bộ con người. Mạng nơ ron nhân tạo được sử dụng để gia tăng khả năng học tập và tự động hóa trong các tác vụ như nhận dạng hình ảnh, xử lý ngôn ngữ, dự đoán và phân loại dữ liệu.
Một mạng nơ ron nhân tạo bao gồm các nút nơ ron (neuron) được kết nối với nhau thông qua các liên kết trọng số (weights). Mỗi nút nơ ron nhận đầu vào từ các nút trước đó và đưa ra đầu ra dựa trên quy tắc hoạt động của nó. Quá trình học của mạng nơ ron nhân tạo bao gồm việc điều chỉnh các trọng số trong liên kết giữa các nơ ron để tối ưu hóa kết quả dự đoán.
Mạng nơ ron nhân tạo đã được áp dụng rộng rãi trong nhiều lĩnh vực như công nghệ thông tin, điện tử, y học, kỹ thuật, v.v. với khả năng xử lý mô hình phức tạp và nhận diện mẫu từ dữ liệu.
Mạng nơ ron nhân tạo được xây dựng dựa trên các nguyên tắc hoạt động của hệ thống nơ ron trong não bộ con người. Một mạng nơ ron nhân tạo bao gồm nhiều lớp nơ ron, trong đó có lớp đầu vào, lớp ẩn (nếu có) và lớp đầu ra. Mỗi nơ ron trong mạng kết nối với các nơ ron khác thông qua các liên kết hoặc synapses, với mỗi liên kết có một trọng số tương ứng.
Quy trình hoạt động của mạng nơ ron nhân tạo bao gồm hai giai đoạn chính: giai đoạn feedforward và giai đoạn backpropagation.
- Feedforward: Trong giai đoạn này, đầu vào của mạng (ví dụ: hình ảnh) được truyền qua các lớp nơ ron theo các liên kết trọng số. Mỗi nơ ron tính toán đầu ra của mình dựa trên đầu vào và trọng số của các liên kết. Quá trình này được lặp đi lặp lại cho đến khi đầu vào đã đi qua tất cả các lớp và đầu ra cuối cùng được tính toán.
- Backpropagation: Sau khi giai đoạn feedforward hoàn thành, mạng đánh giá kết quả đầu ra với các giá trị thực tế (được gọi là nhãn), và tính toán mức độ sai số. Quá trình backpropagation sử dụng thuật toán lan truyền ngược để điều chỉnh các trọng số trong mạng, với mục tiêu là để giảm thiểu sai số giữa kết quả đầu ra dự đoán và nhãn thực tế. Quá trình này được lặp lại cho đến khi đạt được độ chính xác mong muốn.
Các mạng nơ ron nhân tạo có nhiều kiến trúc khác nhau như mạng nơ ron tiếp xúc truyền thẳng (Feedforward Neural Network, FNN), mạng nơ ron hồi quy (Recurrent Neural Network, RNN), mạng nơ ron tích chập (Convolutional Neural Network, CNN) và mạng nơ ron bộ nhớ dài hạn ngắn (Long Short-Term Memory, LSTM). Mỗi kiến trúc có ý nghĩa và ứng dụng riêng trong việc giải quyết các bài toán cụ thể.
Danh sách công bố khoa học về chủ đề "mạng nơ ron nhân tạo":
Mục tiêu chính của nghiên cứu này là đánh giá và so sánh hiệu suất của các thuật toán học máy (ML) khác nhau, cụ thể là Mạng Nơron Nhân Tạo (ANN), Máy Học Tăng Cường (ELM) và thuật toán Cây Tăng Cường (Boosted), khi xem xét ảnh hưởng của các tỷ lệ đào tạo đối với kiểm tra trong việc dự đoán độ bền cắt của đất, một trong những tính chất kỹ thuật địa chất quan trọng nhất trong thiết kế và xây dựng công trình. Để thực hiện điều này, một cơ sở dữ liệu gồm 538 mẫu đất thu thập từ dự án nhà máy điện Long Phú 1, Việt Nam, đã được sử dụng để tạo ra các bộ dữ liệu cho quá trình mô hình hóa. Các tỷ lệ khác nhau (tức là 10/90, 20/80, 30/70, 40/60, 50/50, 60/40, 70/30, 80/20, và 90/10) đã được sử dụng để chia bộ dữ liệu thành bộ dữ liệu đào tạo và kiểm tra nhằm đánh giá hiệu suất của các mô hình. Các chỉ số thống kê phổ biến, chẳng hạn như Lỗi Bình Phương Trung Bình (RMSE), Lỗi Tuyệt Đối Trung Bình (MAE) và Hệ Số Tương Quan (R), đã được sử dụng để đánh giá khả năng dự báo của các mô hình dưới các tỷ lệ đào tạo và kiểm tra khác nhau. Ngoài ra, mô phỏng Monte Carlo đã được thực hiện đồng thời để đánh giá hiệu suất của các mô hình đề xuất, có tính đến ảnh hưởng của lấy mẫu ngẫu nhiên. Kết quả cho thấy mặc dù cả ba mô hình ML đều hoạt động tốt, nhưng ANN là mô hình chính xác nhất và ổn định nhất về mặt thống kê sau 1000 lần mô phỏng Monte Carlo (R Trung Bình = 0.9348) so với các mô hình khác như Boosted (R Trung Bình = 0.9192) và ELM (R Trung Bình = 0.8703). Điều tra về hiệu suất của các mô hình cho thấy khả năng dự báo của các mô hình ML bị ảnh hưởng lớn bởi các tỷ lệ đào tạo/kiểm tra, trong đó tỷ lệ 70/30 thể hiện hiệu suất tốt nhất của các mô hình. Một cách ngắn gọn, kết quả được trình bày ở đây thể hiện một cách thức hiệu quả trong việc lựa chọn các tỷ lệ dữ liệu phù hợp và mô hình ML tốt nhất để dự đoán chính xác độ bền cắt của đất, điều này sẽ hữu ích trong các giai đoạn thiết kế và kỹ thuật của các dự án xây dựng.
Bài viết này trình bày hai phương pháp tối ưu hóa quy trình hỗn hợp mạnh mẽ tích hợp mạng nơron nhân tạo (ANN) và hình thức tối ưu hóa ngẫu nhiên—các thuật toán di truyền (GA) và phương pháp xấp xỉ ngẫu nhiên đồng thời (SPSA). Một mô hình quy trình dựa trên ANN đã được phát triển hoàn toàn từ dữ liệu đầu vào–đầu ra của quy trình và sau đó không gian đầu vào của nó, bao gồm các biến thiết kế và biến vận hành, đã được tối ưu hóa bằng cách sử dụng hoặc phương pháp GA hoặc SPSA. Các phương pháp này sở hữu một số ưu điểm so với các kỹ thuật dự đoán xác định dựa trên gradient rất được sử dụng. Hiệu quả của các hình thức ANN-GA và ANN-SPSA trong sự hiện diện của dữ liệu quy trình không có tiếng ồn cũng như dữ liệu quy trình có tiếng ồn đã được chứng minh cho một hệ thống đại diện liên quan đến CSTR không đồng nhất. Nghiên cứu trường hợp xem xét một mục tiêu tối ưu hóa không đơn giản, mà ngoài việc thiết kế tham số truyền thống, còn giải quyết vấn đề thiết kế dung sai tối ưu. So sánh các kết quả với các kết quả từ một chiến lược mô hình hóa/tối ưu hóa xác định mạnh mẽ cho thấy rằng các phương pháp hỗn hợp có thể được áp dụng có hiệu quả cho tối ưu hóa quy trình.
- 1
- 2
- 3
- 4
- 5
- 6
- 7